区間推定を理解する
さて...区間推定,t検定,などなど,苦手です...
一向に全体像がつかめない...自由度ってなに????
ということで,勉強してみました,おもに,統計Web,統計検定を理解せずに使っている人のために(1,2,3),などです.
今回はあまり自信がありません...なので,このサイトでは間違った考え方,勘違いがあることを十分承知してください,私の覚え書き,ていどの内容です...
・検定,推定の流れ
私の理解では,検定,推定の流れは....
1.対象(母集団)の平均(母平均),分散(母分散)を求めたい
(テレビの視聴率,支持率など,ここでは母集団は日本国民か?)
2.しかし,全部調べることは難しいので,そのなかからピックアップ(標本)を集める
その平均(標本平均),分散(標本分散,不偏分散)から,
母集団の平均(母平均),分散(母分散)を推定する
3.標本平均は必ずしも母平均と一致しない
しかし,標本の数,試行回数が多いほど母平均の推定精度は上がる(大数の法則)
4.標本を繰り返し行い,その平均値の分布を見ると,中央が高く裾野をもった分布になる(中心極限定理)
その分布は正規分布(っぽく)なる
測定回数が多くなると,その分布がシャープになってくる
5.その分布から母平均の推定範囲をある程度決めることができる
しかし,厳密に範囲指定できないので,95%(など)可能性の高い範囲を決める(信頼空間)
この領域内ならもっともらしい..と
6.この分布は,2つの異なる母集団の違いについても議論できる,つまり,
2つの異なる母集団からの標本平均の差も,正規分布(っぽく)なるので,同じロジックを使える
というものです.
まずは,中心極限定理,から.